检索结果

Select

1. 基于注意力机制的多特征融合对话行为层次化分类方法

贾宗泽, 高鹏飞, 马应龙, 刘晓峰, 夏海鑫

《计算机应用》唯一官方网站 2024, 44 (3): 715-721. DOI: 10.11772/j.issn.1001-9081.2023030358

摘要（176）

HTML （16）

PDF （1143KB）（172）

目前深度学习模型在对话行为识别中被广泛采用，通过挖掘多种对话行为特征以提升对话行为分类性能。然而，这些方法忽视了不同对话行为特征之间的潜在关联和相互影响，且对话行为分类过程中也很少考虑对话行为标签之间的语义关联关系，这些都妨碍了对话行为识别的性能提升。针对以上问题，提出一种基于注意力机制的多特征融合层次化分类（MFA-HC）方法用于对话行为识别。首先，提出一种基于无遗忘学习的对话行为层次化分类框架，结合词、词性以及相关语言学统计量等多种细粒度特征来学习训练对话行为分类模型；其次，提出一种基于注意力机制的共性-个性模型捕获不同特征之间的共性和个性特征。在两个基准数据集SwDA（Switchboard Dialogue Act corpus）和MRDA（ICSI Meeting Recorder Dialogue Act corpus）上的实验结果表明：相较于目前整体性能较优的DARER（Dual-tAsk temporal Relational rEcurrent Reasoning network），MFA-HC方法通过捕捉话语中隐含的共性和个性特征，分类准确率分别提高了0.6%和0.1%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 语义驱动的司法文档学习分类方法

马建刚, 马应龙

计算机应用 2019, 39 (6): 1696-1700. DOI: 10.11772/j.issn.1001-9081.2018109193

摘要（372）

PDF （793KB）（258）

基于海量的司法文书进行的高效司法文档分类有助于目前的司法智能化应用，如类案推送、文书检索、判决预测和量刑辅助等。面向通用领域的文本分类方法因没有考虑司法领域文本的复杂结构和知识语义，导致司法文本分类的效能很低。针对该问题提出了一种语义驱动的方法来学习和分类司法文书。首先，提出并构建了面向司法领域的领域知识模型以清晰表达文档级语义；然后，基于该模型对司法文档进行相应的领域知识抽取；最后，利用图长短期记忆模型（Graph LSTM）对司法文书进行训练和分类。实验结果表明该方法在准确率和召回率方面明显优于常用的长短期记忆（LSTM）模型、多类别逻辑回归和支持向量机等方法。

参考文献 | 相关文章 | 多维度评价

Select

3. 基于知识块摘要和词转移距离的高效司法文档分类

马建刚, 张鹏, 马应龙

计算机应用 2019, 39 (5): 1293-1298. DOI: 10.11772/j.issn.1001-9081.2018102085

摘要（495）

PDF （1025KB）（340）

随着全国司法机关智能化建设的深入推进，通过信息化建设应用所积累的海量司法文书为开展司法智能服务提供了司法数据分析基础。通过司法文书的相似性分析实现类案推送，可以为司法人员提供智能辅助办案决策支持，从而提高办案的质量和效率。针对面向通用领域的文本分类方法因没有考虑特定司法领域文本的复杂结构和知识语义而导致司法文本分类的效能低问题，提出一种基于司法知识块摘要和词转移距离（WMD）的高效司法文档分类方法。首先为司法文书构建领域本体知识模型，进而基于领域本体，利用信息抽取技术获取司法文档中核心知识块摘要；然后基于司法文本的知识块摘要利用WMD进行司法文档相似度计算；最后利用 K最近邻算法进行司法文本分类。以两个典型罪名的案件文档集作为实验数据，与传统的WMD文档相似度计算方法进行对比，实验结果表明，所提方法能明显提高司法文本分类的正确率（分别有5.5和9.9个百分点的提升），同时也降低了文档分类所需的时间（速度分别提升到原来的52.4和89.1倍）。

参考文献 | 相关文章 | 多维度评价